In [1]:
text = 'yeah, but no, but yeah, but no, but yeah'
text.replace("yeah", "yep")
Out[1]:
对于复杂的模式,请使用 re
模块中的 sub()
函数。 为了说明这个,假设你想将形式为 11/27/2012
的日期字符串改成 2012-11-27
。示例如下:
In [2]:
text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
import re
re.sub(r"(\d+)/(\d+)/(\d+)", r"\3-\1-\2", text)
Out[2]:
sub()
函数中的第一个参数是被匹配的模式,第二个参数是替换模式。反斜杠数字比如 \3
指向前面模式的捕获组号。
如果你打算用相同的模式做多次替换,考虑先编译它来提升性能。比如:
In [3]:
import re
datepat = re.compile(r"(\d+)/(\d+)/(\d+)")
datepat.sub(r"\3-\1-\2", text)
Out[3]:
对于更加复杂的替换,可以传递一个替换回调函数来代替,比如:
In [4]:
from calendar import month_abbr
def change_date(m):
mon_name = month_abbr[int(m.group(1))]
return "{} {} {}".format(m.group(2), mon_name, m.group(3))
In [5]:
datepat.sub(change_date, text)
Out[5]:
一个替换回调函数的参数是一个 match
对象,也就是 match()
或者 find()
返回的对象。 使用 group()
方法来提取特定的匹配部分。回调函数最后返回替换字符串。
如果除了替换后的结果外,你还想知道有多少替换发生了,可以使用 re.subn()
来代替。比如:
In [6]:
newtext, n = datepat.subn(r"\3-\1-\2", text)
newtext
Out[6]:
In [7]:
n
Out[7]: